Korpus: deu_wikipedia_2016_300K, 4.7.3.1 Most Frequent Hash Values For Sentences

Korpus: deu_wikipedia_2016_300K

Weitere Korpora

Afrikaans
- News
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2007 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- South Africa
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
Albanian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Amharic
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Arabic
- News
  - 2005-2009 10K
  - 2005-2009 30K
  - 2005-2009 100K
  - 2005-2009 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Newscrawl
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Bahrain
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2017 10K
    - 2017 30K
- Egypt
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lebanon
  - Newscrawl
- Mauritania
  - Newscrawl
    - 2012 10K
    - 2012 30K
- Morocco
  - Newscrawl
- Palestine
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
- Syria
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
- Tunisia
  - Newscrawl
- United Arab Emirates
  - News
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Aragonese
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Armenian
- Newscrawl
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Armenia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Assamese
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Asturian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Azerbaijani
- Newscrawl
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Balinese
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
Banjar
- Indonesia
  - Web
    - 2015 10K
Bashkir
- News
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Basque
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
Bavarian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Belarusian
- News
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Belarus
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Bengali
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Bangladesh
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Bihari
- Wikipedia
  - 2016 10K
  - 2018 10K
Bikol
- Wikipedia
  - 2016 10K
  - 2018 10K
Bishnupriya
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Bosnian
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Breton
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Bulgarian
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Buriat
- Wikipedia
  - 2016 10K
  - 2018 10K
Catalan
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2004 10K
  - 2004 30K
  - 2004 100K
  - 2004 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Andorra
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- COM
  - Web
- European Union
  - Web
Cebuano
- Newscrawl
  - 2011 10K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2011 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Central Bikol
- Wikipedia
  - 2011 10K
  - 2014 10K
Central Kurdish
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Chechen
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Chinese
- News
- China, People's Republic of
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Macau
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- SIMP
  - News
    - 2009 10K
    - 2009 30K
    - 2009 100K
    - 2009 300K
    - 2010 10K
    - 2010 30K
    - 2010 100K
    - 2010 300K
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- TRAD
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
Chuvash
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Corsican
- Wikipedia
Croatian
- Newscrawl
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Croatia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Czech
- News
  - 2005 10K
  - 2005 30K
  - 2005-2007 10K
  - 2005-2007 30K
  - 2005-2007 100K
  - 2005-2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Danish
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Denmark
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
- Faroe Islands
  - Web
- Greenland
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Dhivehi
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
- Maldives
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Dimli
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2018 30K
Dotyali
- Wikipedia
  - 2018 10K
Dutch
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Aruba
  - Web
    - 2015 10K
    - 2017 10K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Netherlands Antilles
  - Web
    - 2013 10K
- Suriname
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Eastern Mari
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Egyptian Arabic
- Wikipedia
  - 2016 10K
  - 2016 30K
Emiliano-Romagnolo
- Wikipedia
English
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- American Samoa
  - Web
    - 2017 10K
    - 2017 30K
- Anguilla
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Antigua and Barbuda
  - Web
    - 2013 10K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Ascension
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Australia
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Bahamas, The
  - Web
- Barbados
  - Web
    - 2015 10K
    - 2015 30K
- Bermuda
  - Web
- Botswana
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- British Indian Ocean Territory
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Brunei
  - Web
    - 2015 10K
    - 2015 30K
- Canada
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Dominica
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2015 10K
    - 2015 30K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Fiji
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Gambia, The
  - Web
- Germany
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Gibraltar
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guadeloupe
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guyana
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Kiribati
  - Web
    - 2013 10K
    - 2013 30K
- Montserrat
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
- Namibia
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Nauru
  - Web
    - 2015 10K
    - 2015 30K
- New Zealand
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Niue
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Philippines
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Puerto Rico
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
- Saint Kitts and Nevis
  - Web
    - 2013 10K
    - 2013 30K
- Saint Lucia
  - Web
- Saint Pierre and Miquelon
  - Web
    - 2016 10K
    - 2016 30K
- Saint Vincent and the Grenadines
  - Web
    - 2015 10K
    - 2016 10K
- Seychelles
  - Web
- Singapore
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- South Africa
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- South Georgia & South Sandwich Islands
  - Web
- Thailand
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Turks and Caicos Islands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- United Kingdom
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
- Zambia
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Zimbabwe
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
Erzya
- Wikipedia
  - 2018 10K
Esperanto
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
Estonian
- News
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Estonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
Extremaduran
- Wikipedia
Faroese
- Web
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
- Faroe Islands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Fiji Hindi
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Finnish
- News
  - 2005 10K
  - 2005 30K
  - 2005-2007 10K
  - 2005-2007 30K
  - 2005-2007 100K
  - 2005-2007 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
French
- News
  - 2002-2005 10K
  - 2002-2005 30K
  - 2002-2005 100K
  - 2002-2005 300K
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2008 10K
  - 2005-2008 30K
  - 2005-2008 100K
  - 2005-2008 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Newscrawl-public
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Belgium
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Benin
  - Web
    - 2013 10K
    - 2015 10K
    - 2017 10K
    - 2017 30K
- Burkina Faso
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Burundi
  - Web
    - 2015 10K
    - 2015 30K
- Cameroon
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Canada
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Congo, (Congo & Kinshasa)
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Cote d'Ivoire (Ivory Coast)
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- France
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- French Polynesia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Gabon
  - Web
    - 2013 10K
    - 2013 30K
- Guadeloupe
  - Web
    - 2014 10K
    - 2014 30K
- Haiti
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Luxembourg
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2012 10K
    - 2012 30K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Madagascar
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Mali
  - Web
- Martinique
  - Web
    - 2016 10K
- Monaco
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- New Caledonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Niger
  - Web
    - 2013 10K
- Reunion
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Rwanda
  - Web
    - 2013 10K
    - 2013 30K
- Senegal
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Switzerland
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Togo
  - Web
    - 2013 10K
- Tuvalu
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Friulian
- Wikipedia
  - 2018 10K
Galician
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Ganda
- Newscrawl
  - 2013 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2018 10K
Georgian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Georgia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
German
- News
  - 1995 10K
  - 1995 30K
  - 1995 100K
  - 1995 300K
  - 1996 10K
  - 1996 30K
  - 1996 100K
  - 1996 300K
  - 1997 10K
  - 1997 30K
  - 1997 100K
  - 1997 300K
  - 1998 10K
  - 1998 30K
  - 1998 100K
  - 1998 300K
  - 1999 10K
  - 1999 30K
  - 1999 100K
  - 1999 300K
  - 2001 10K
  - 2001 30K
  - 2001 100K
  - 2001 300K
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2003 10K
  - 2003 30K
  - 2003 100K
  - 2003 300K
  - 2004 10K
  - 2004 30K
  - 2004 100K
  - 2004 300K
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2010 1M
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Austria
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Belgium
  - Web
    - 2013 10K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Hungary
  - Web
    - 2013 10K
- Luxembourg
  - Web
    - 2013 10K
- Namibia
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2013 10K
    - 2013 30K
    - 2019 10K
    - 2019 30K
    - 2019 100K
- Poland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Switzerland
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
Gilaki
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2016 10K
Goan Konkani
- Newscrawl
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2016 10K
  - 2018 10K
Guarani
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Gujarati
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2014 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Haitian
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2012 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
- Haiti
  - Web
Hebrew
- News
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Hindi
- News
  - 2007 10K
  - 2007 30K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Hungarian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- COM
  - Web
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Hungary
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Romania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Slovakia
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Icelandic
- News
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Iceland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Ido
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Iloko
- Wikipedia
Indonesian
- News
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-tufs5
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-tufs6
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Brunei
  - Web
    - 2015 10K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Interlingua
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Interlingue
- Wikipedia
  - 2018 10K
Iranian Persian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Iran
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Irish
- Newscrawl
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Italian
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2009 10K
  - 2005-2009 30K
  - 2005-2009 100K
  - 2005-2009 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- San Marino
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Switzerland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Japanese
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2008 10K
  - 2005-2008 30K
  - 2005-2008 100K
  - 2005-2008 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
Javanese
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- BMS
  - Wikipedia
    - 2016 10K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
Kabiyè
- Wikipedia
  - 2018 10K
Kalaallisut
- Newscrawl
  - 2011 10K
  - 2011 30K
- Greenland
  - Web
    - 2014 10K
    - 2014 30K
Kannada
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Karachay-Balkar
- Wikipedia
Kashubian
- Wikipedia
  - 2016 10K
  - 2018 10K
Kazakh
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Kazakhstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Kirghiz
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Komi
- Wikipedia
Komi-Permyak
- Wikipedia
Konkani
- India
  - Web
    - 2015 10K
Korean
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Korea, South
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Kurdish
- Newscrawl
  - 2011 10K
  - 2011 30K
Kölsch
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Ladino
- Wikipedia
  - 2018 10K
Latin
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Latvian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Latvia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Lezghian
- Wikipedia
  - 2018 10K
Limburgan
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Netherlands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Lithuanian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- LIT
  - News
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lithuania
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Lombard
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Low German
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
- Netherlands
  - Wikipedia
    - 2016 10K
Lower Sorbian
- Wikipedia
  - 2016 10K
  - 2018 10K
Lushai
- Newscrawl
  - 2011 10K
  - 2011 30K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2015 10K
    - 2015 30K
Luxembourgish
- Newscrawl
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Luxembourg
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Macedonian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Macedonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Madurese
- Indonesia
  - Web
    - 2013 10K
Maithili
- Wikipedia
  - 2018 10K
Malagasy
- Web
  - 2012 10K
  - 2012 30K
- Wikipedia
Malay
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-tufs5
  - 2011 10K
- Newscrawl-tufs6
  - 2012 10K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- India
  - Web
- Malaysia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
Malayalam
- Newscrawl
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Maltese
- Newscrawl
  - 2011 10K
  - 2012 10K
  - 2012 30K
  - 2012 100K
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2012 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Mandarin Chinese
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
- TRAD
  - Wikipedia
    - 2018 10K
    - 2018 30K
Manx
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Maori
- Web
- New Zealand
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Marathi
- News
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Mazanderani
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Min Nan Chinese
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Minangkabau
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Indonesia
  - Web
    - 2013 10K
Mingrelian
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Mirandese
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Modern Greek
- News
  - 2007 10K
  - 2007 30K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Greece
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Mongolian
- News
  - 2011 100K
- Newscrawl
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Navajo
- Wikipedia
  - 2018 10K
Nepali
- News
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Nepal
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Newari
- Wikipedia
  - 2009 10K
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
North Azerbaijani
- Wikipedia
  - 2007 10K
- Azerbaijan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Northern Frisian
- Wikipedia
  - 2016 10K
  - 2018 10K
Northern Sami
- Wikipedia
  - 2018 10K
- Norway
  - News
    - 2015 10K
  - Web
    - 2013 10K
Northern Uzbek
- Uzbekistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Norwegian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
Norwegian Bokmål
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Newscrawl
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
- Norway
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Norwegian Nynorsk
- Newscrawl
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Norway
  - Web
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Occitan
- Wikipedia
  - 2007 10K
  - 2012 10K
  - 2012 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Oriya
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Ossetian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Pampanga
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Panjabi
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- India
  - Web
Papiamento
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
Pedi
- South Africa
  - Web
    - 2018 10K
Persian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2012 10K
  - 2012 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Iran
  - Web
Pfaelzisch
- Wikipedia
Piemontese
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Plateau Malagasy
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Polish
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Portuguese
- News
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Brazil
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Cape Verde
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- European Union
  - Web
- Macau
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Mozambique
  - Web
- Netherlands Antilles
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Portugal
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Pushto
- Newscrawl
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2018 30K
Quechua
- Wikipedia
  - 2011 10K
  - 2012 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Romanian
- News
  - 1998-2007 10K
  - 1998-2007 30K
  - 1998-2007 100K
  - 1998-2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Moldova
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Romania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Romansh
- Newscrawl
  - 2016 10K
  - 2016 30K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
- Switzerland
  - Web
    - 2015 10K
    - 2016 10K
    - 2016 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Russian
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Azerbaijan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Estonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Georgia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Kazakhstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Kyrgyzstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Latvia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lithuania
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Moldova
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- SU
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Tajikistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Tuvalu
  - Web
    - 2015 10K
    - 2015 30K
- Ukraine
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Uzbekistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Rusyn
- Wikipedia
  - 2018 10K
- Ukraine
  - Web
    - 2016 10K
Samogitian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Sanskrit
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Sardinian
- Wikipedia
Saterfriesisch
- Wikipedia
  - 2018 10K
Scots
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Serbian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Bosnia and Herzegovina
  - Web
- Montenegro
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Serbia
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Serbo-Croatian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Bosnia and Herzegovina
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2014 10K
    - 2014 30K
    - 2014 100K
- Croatia
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2007 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- European Union
  - Web
- Serbia
  - News
    - 2007 10K
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2007 300K
    - 2010 10K
    - 2010 30K
    - 2010 100K
    - 2010 300K
Shona
- Web
  - 2012 10K
  - 2012 30K
- Zimbabwe
  - Newscrawl
    - 2013 10K
    - 2013 30K
  - Web
    - 2013 10K
    - 2015 10K
    - 2016 10K
    - 2016 30K
    - 2018 10K
    - 2018 30K
    - 2018 100K
Sicilian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Silesian
- Wikipedia
  - 2016 10K
  - 2018 10K
Sindhi
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Sinhala
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Slovak
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Slovakia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Slovenian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
- Slovenia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Somali
- Newscrawl
- Wikipedia
  - 2016 10K
  - 2018 10K
Southern Sotho
- South Africa
  - Web
    - 2015 10K
    - 2018 10K
Spanish
- News
  - 2001-2002 10K
  - 2001-2002 30K
  - 2001-2002 100K
  - 2001-2002 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Newscrawl-public
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Andorra
  - Web
    - 2013 10K
    - 2013 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Argentina
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Bolivia
  - Web
    - 2015 10K
- Colombia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Costa Rica
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Cuba
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Dominican Republic
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Ecuador
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- El Salvador
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guatemala
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Honduras
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Mexico
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Nicaragua
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Panama
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Paraguay
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Peru
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Puerto Rico
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- United States
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Uruguay
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Venezuela
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Standard Estonian
- Web
  - 2011 10K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Standard Latvian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Standard Malay
- Newscrawl-tufs15
Sundanese
- Wikipedia
  - 2007 10K
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
Swahili
- Newscrawl
- Wikipedia
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Swedish
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Sweden
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Swiss German
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Switzerland
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Tagalog
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2007 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Tajik
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
- Tajikistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Uzbekistan
  - Web
    - 2015 10K
Tamil
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Tatar
- News
- Web
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Telugu
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Thai
- Newscrawl
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2016 10K
- Thailand
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 100K
Tosk Albanian
- Wikipedia
  - 2007 10K
  - 2007 30K
- Albania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- SQI
  - News
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Tsonga
- South Africa
  - Web
    - 2018 10K
Tswana
- Botswana
  - Web
    - 2018 10K
Tulu
- Wikipedia
  - 2018 10K
Turkish
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Bulgaria
  - Web
    - 2015 10K
    - 2015 30K
- Cyprus
  - Web
- European Union
  - Web
    - 2014 10K
    - 2014 30K
- Turkey
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Turkmen
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
- Turkmenistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Tuvinian
- Wikipedia
  - 2016 10K
  - 2018 10K
Udmurt
- Wikipedia
  - 2016 10K
  - 2018 10K
Uighur
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Ukrainian
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- European Union
  - Web
- Ukraine
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2019 100K
    - 2019 300K
Upper Sorbian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Urdu
- News
  - 2007 10K
  - 2007 30K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Pakistan
  - Newscrawl
    - 2012 10K
Uzbek
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Venetian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2018 10K
- Brazil
  - Web
    - 2015 10K
    - 2015 30K
- Croatia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2015 10K
    - 2015 30K
    - 2015 100K
Vietnamese
- News
  - 2007 10K
  - 2007 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Cambodia
  - Web
    - 2013 10K
- Vietnam
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Vlaams
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Volapük
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Võro
- Wikipedia
Walloon
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Waray (Philippines)
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Welsh
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Western Frisian
- Newscrawl
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
Western Mari
- Wikipedia
Western Panjabi
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Wu Chinese
- Wikipedia
Xhosa
- South Africa
  - Web
Yakut
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Yiddish
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
Yoruba
- Wikipedia
  - 2016 10K
  - 2018 10K
Yue Chinese
- Wikipedia
Zeeuws
- Wikipedia
Zulu
- News
  - 2013 10K
  - 2013 30K
- Web
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
- South Africa
  - Web
    - 2013 10K
    - 2015 10K
    - 2015 30K
    - 2018 10K
    - 2018 30K

4.7.3.1 Most Frequent Hash Values For Sentences

Identical Hash Values may result from similar sentences.

Number of distinct hash values

# of distinct signatures	# of sentences	Ratio
0	0	null

7 msec needed at 2017-12-08 13:38